Подписаться
Опубликовано

Для машинного обучения наши алгоритмы — игра

Автор
  • Имя
    Счастливый тимлид | ♥ Frontend
    Telegram

Для машинного обучения наши алгоритмы — игра

Помните, как AlphaGo ИИ система основанная на обучении с подкреплением (reinforcement learning) изобрела новую стратегию в игре Го и выиграла всех мастеров?

Группа DeepMind построили на ее основе систему AlphaDev и пробуют с ее помощью улучшать алгоритмы. Первой пала сортировка. AlphaDev получает «игровые очки» если системе удается ускорить сортировку. Путем перебора она изобрела новый алгоритм, который на коротких наборах данных быстрее на 70%, а на больших наборах на 2%.

Алгоритм уже запиливают в LLVM и пробуют оптимизировать другие алгоритмы, хеширование, например.

Коечно, это просто перебор с обратной связью, но я думаю, что тут важнее результат, а не наличие осмысленности действий. Полученный аглоритм вообще выглядит как ошибка на первый взгляд человека.

https://www.deepmind.com/blog/alphadev-discovers-faster-sorting-algorithms

Счастливый тимлид | ♥ Frontend
2204 подписчика
692 поста

Закрепленные

Из подборки #AI

Опубликовано
#AI
+1

Раз в год можно и в офис съездить

Раз в год можно и в офис съездить: big tech night в Яндексе, AI‑лекция, турнир Worms, тимлидский квартирник в T‑банке

Свежие посты

Опубликовано

Телеграмовский сосун (или какун, как правильно?)

Телеграмовский сосун суммирует мой лонгрид – стоит ли публиковать полную версию?